智能论文笔记

Towards A Measure Of General Machine Intelligence

Gautham Venkatasubramanian , Sibesh Kar , Abhimanyu Singh , Shubham Mishra , Dushyant Yadav , Shreyansh Chandak

分类：人工智能 | 机器学习

2021-09-24

建立可以在未知域中处理未知变量的通用人工智能系统，我们需要基准测试这些系统在从未见过的任务上的执行程度。这是一个先决条件是一项衡量任务泛化困难的衡量标准，或者它来自系统的先验知识和经验是多么异议。如果在特定域中的智能系统的技能被定义为能够始终生成一组指令（或程序）来解决该域中的任务，则当前的基准未定量测量获取新技能的效率，使其成为可能通过利用无限量的数据和计算能力训练来训练技能。考虑到这一点，我们首先提出了一种常识的教学语言，一种编程语言，允许以各种现实世界域和计算平台的指导的无循环图表表达程序。使用以这种语言生成的程序，我们演示了一种基于匹配的方法，可以进行评分性能，并计算任何给定的任务集的泛化难度。我们使用这些来定义一个名为泛化索引或G-索引的数字基准，以测量和比较任何智能系统的一组真实任务的技能 - 获取效率。最后，我们通过计算G-Index分数来评估一些着名模型作为一般情报系统的适用性。

translated by 谷歌翻译

Differentiable physics-enabled closure modeling for Burgers' turbulence

Varun Shankar , Vedant Puri , Ramesh Balakrishnan , Romit Maulik , Venkatasubramanian Viswanathan

分类：机器学习

2022-09-23

数据驱动的湍流建模正在经历数据科学算法和硬件开发后的兴趣激增。我们讨论了一种使用可区分物理范式的方法，该方法将已知的物理学与机器学习结合起来，以开发汉堡湍流的闭合模型。我们将1D汉堡系统视为一种原型测试问题，用于建模以对流为主的湍流问题中未解决的术语。我们训练一系列模型，这些模型在后验损失函数上结合了不同程度的物理假设，以测试模型在一系列系统参数（包括粘度，时间和网格分辨率）上的疗效。我们发现，以部分微分方程形式的归纳偏差的约束模型包含已知物理或现有闭合方法会产生高度数据效率，准确和可推广的模型，并且表现优于最先进的基准。以物理信息形式添加结构还为模型带来了一定程度的解释性，可能为封闭建模的未来提供了垫脚石。

translated by 谷歌翻译

Toward Data-Driven Radar STAP

Shyam Venkatasubramanian , Sandeep Gogineni , Bosung Kang , Ali Pezeshki , Muralidhar Rangaswamy , Vahid Tarokh

分类：计算机视觉

2022-09-07

在过去的十年中，由于雷达目的的现场特异性，高保真射频（RF）建模和仿真工具的催化，在过去的十年中，经典方法的数据驱动公式迅速增长。尽管有这种激增，但有限的焦点已针对这些经典方法的理论基础。在这方面，作为我们正在进行的数据驱动的雷达时空自适应处理方法（Stap）的一部分，我们在雷达目标定位的背景下分析了精选子空间分离方法的渐近性能保证，并通过拟议目标位置估计的深度学习框架。在我们的方法中，我们通过使用RFView（由ISL Inc.开发的一个特定于站点的RF建模和模拟工具）将可变强度的目标随机放置在预定的约束区域中。在范围内，方位角和归一化自适应匹配过滤器（NAMF）测试统计量以及广义Sidelobe canceller（GSC）的输出功率的高度。使用我们的深度学习框架，我们从这些热图张量估算目标位置，以证明我们数据驱动方法在匹配和不匹配的设置中提供的可行性和显着改进。

translated by 谷歌翻译

Image Based Food Energy Estimation With Depth Domain Adaptation

Gautham Vinod , Zeman Shao , Fengqing Zhu

分类：计算机视觉 | 人工智能 | 机器学习

2022-08-25

饮食摄入量的评估主要依赖于自我报告工具，后者容易出现测量错误。饮食评估方法越来越多地纳入了技术进步，特别是基于图像的方法，以解决这些局限性和进一步的自动化。基于图像的方法可以通过自动估算由移动设备捕获的图像来自动估算饮食摄入量来减轻用户负担和偏见。在本文中，我们提出了一个“能量密度图”，该图是从RGB图像到食物的能量密度的像素到像素映射。然后，我们将“能量密度图”与相关的深度图合并在一起，该图由深度传感器捕获以估计食物能量。在Nutrition5K数据集上评估了所提出的方法。实验结果表明，与基线方法相比，结果的改善，平均误差为13.29 kcal，平均误差的平均百分比误差为13.57％，而食物的估计能量的平均百分比误差为13.57％。

translated by 谷歌翻译

HTML版本

AI-driven Hypernetwork of Organic Chemistry: Network Statistics and Applications in Reaction Classification

Vipul Mann , Venkat Venkatasubramanian

分类：人工智能 | 机器学习

2022-08-02

近年来，高吞吐量筛选的进步，对更复杂的化学设计空间的可访问性以及准确的分子建模框架的发展，近年来快速发现了新的反应和分子。因此，对不断增长的化学文献进行的整体研究是必需的，该研究重点是理解最近的趋势并将其推断到可能的未来轨迹中。为此，已经报道了几项基于网络理论的研究，该研究使用了化学反应的定向图表示。在这里，我们根据代表化学反应作为超图表的研究进行了一项研究，其中超蛋白代表化学反应，节点代表参与分子。我们使用标准反应数据集来构建超网络，并报告其统计数据，例如学位分布，平均路径长度，分类性或程度相关性，pagerank中心性和基于图的集群（或社区）。我们还计算了每个统计量的反应的等效的有向图表示，以绘制相似之处并突出两者之间的差异。为了证明超图反应表示的AI适用性，我们生成致密的超透明嵌入，并将其用于反应分类问题。我们得出的结论是，超网络表示是灵活的，可以保留反应环境，并发现了隐藏的见解，这些洞察力在传统的化学反应的传统图形表示中却不明显。

translated by 谷歌翻译

Identifying Orientation-specific Lipid-protein Fingerprints using Deep Learning

Fikret Aydin , Konstantia Georgouli , Gautham Dharuman , James N. Glosli , Felice C. Lightstone , Helgi I. Ingólfsson , Peer-Timo Bremer , Harsh Bhatia

分类：机器学习

2022-07-14

对RAS和RAF蛋白的行为与细胞膜中局部脂质环境之间关系之间的关系的了解对了解癌症形成的基础机制至关重要。在这项工作中，我们采用深度学习（DL）来学习这种关系，通过预测基于脂质膜的RAS和RAS-RAF蛋白复合物的蛋白质定位状态，该状态基于蛋白质结构域周围的脂质密度（CG），相对于脂质膜。分子动力学（MD）模拟。我们的DL模型可以预测六个蛋白质状态，总体准确性超过80％。这项工作的发现为蛋白质如何调节脂质环境提供了新的见解，这反过来又可以帮助设计新型疗法以调节与癌症发展相关的机制中的这种相互作用。

translated by 谷歌翻译

Real-time Detection of Anomalies in Multivariate Time Series of Astronomical Data

Daniel Muthukrishna , Kaisey S. Mandel , Michelle Lochner , Sara Webb , Gautham Narayan

分类：机器学习

2021-12-15

天文瞬态是在各种时间尺度变得暂时更亮的恒星物体，并导致宇宙学和天文学中的一些最重要的发现。其中一些瞬变是被称为超新星的爆炸物的爆炸性死亡，而其他瞬间是罕见的，异国情调的，或完全是新的令人兴奋的恒星爆炸。新的天文天空调查正在观察前所未有的多波长瞬变数量，在视觉上识别新的和有趣的瞬态的标准方法不可行。为了满足这一需求，我们提出了两种新的方法，旨在实时快速，自动地自动检测异常瞬态光线曲线。两种方法都基于简单的想法，如果可以精确建模来自已知瞬态频体群体的光曲线，则从模型预测的任何偏差可能是异常的。第一方法是使用时间卷积网络（TCN）建造的概率神经网络，第二个是瞬态的可解释的贝叶斯参数模型。我们展示了神经网络的灵活性，使它们成为许多回归任务的这种强大工具的属性，是与我们的参数模型相比时不太适合于异常检测的原因。

translated by 谷歌翻译

Theoretical Analysis of an XGBoost Framework for Product Cannibalization

Gautham Bekal , Mohammad Bari

分类：机器学习

2021-12-02

本文是我们的工作延伸，在那里我们提出了一种三阶段XGBoost算法，用于在产品钙化方案下预测销售额。以前我们根据我们的直觉开发了该模型，并提供了对其性能的实证证据。在这项研究中，我们将简要介绍算法，然后在其工作后面提供数学推理。

translated by 谷歌翻译

An XGBoost-Based Forecasting Framework for Product Cannibalization

Gautham Bekal , Mohammad Bari

分类：机器学习 | 人工智能

2021-11-24

需求预测的两个主要挑战是产品蚕食和长期预测。产品蚕食是一种现象，其中一些产品的高需求导致其他产品的销售额降低。长期预测涉及预测销售对战略业务目的至关重要的延长时间框架。此外，例如，传统方法，例如，复发性神经网络可能是无效的，其中火车数据大小很小，如本研究中的情况。这项工作提出了基于XGBoost的三阶段框架，解决了产品蚕食和相关的长期误差传播问题。与常规XGBoost算法相比，比较了所提出的三阶段基于XGBoost的框架的性能。

translated by 谷歌翻译

Certifying and removing disparate impact

Michael Feldman , Sorelle Friedler , John Moeller , Carlos Scheidegger , Suresh Venkatasubramanian

分类：

2014-12-11

What does it mean for an algorithm to be biased? In U.S. law, unintentional bias is encoded via disparate impact, which occurs when a selection process has widely different outcomes for different groups, even as it appears to be neutral. This legal determination hinges on a definition of a protected class (ethnicity, gender) and an explicit description of the process.When computers are involved, determining disparate impact (and hence bias) is harder. It might not be possible to disclose the process. In addition, even if the process is open, it might be hard to elucidate in a legal setting how the algorithm makes its decisions. Instead of requiring access to the process, we propose making inferences based on the data it uses.We present four contributions. First, we link disparate impact to a measure of classification accuracy that while known, has received relatively little attention. Second, we propose a test for disparate impact based on how well the protected class can be predicted from the other attributes. Third, we describe methods by which data might be made unbiased. Finally, we present empirical evidence supporting the effectiveness of our test for disparate impact and our approach for both masking bias and preserving relevant information in the data. Interestingly, our approach resembles some actual selection practices that have recently received legal scrutiny.

translated by 谷歌翻译